Stars Arena_Stars Arena相关新闻_Stars Arena动态

人均第一，具身智能榜单能信吗？

文章探讨具身智能领域榜单泛滥与‘第一’通胀现象，以千寻智能Spirit v1.6登榜后被除名为典型案例，揭示榜单评测标准不一、刷分机制漏洞、话术包装及商业利益介入等问题，指出当前缺乏统一技术标尺，呼吁回归分项透明、第三方主导、反过拟合的可信评测体系。

定焦One07月21日 09:07

Tiger Research：扎克伯格开始押注预测市场，而亚洲国家却仍视其为赌博

预测市场已发展为成熟产业，月交易量超140亿美元，Meta推出Arena项目标志其进入主流；其核心机制是二元结算的价格即概率模型，依托‘皮肤在游戏中’提升信息可信度；西方将其纳入金融监管体系，而亚洲多国仍视其为赌博，导致资本外流、信息主权流失与用户保护缺位，亟需转向在正规框架内负责任利用。

Tiger Research07月11日 18:41

年入1亿美元，两个90后伯克利室友，搞出最赚钱的AI生意

两个90后伯克利室友创立的AI评测平台Arena，起源于开源项目Chatbot Arena，通过用户真实盲测构建大模型Elo排行榜，成为OpenAI、谷歌等巨头验证模型性能的核心第三方平台；商业化服务上线8个月后年化营收达1亿美元，以中立评测服务切入AI模型调优刚需，估值达17亿美元。

新智元07月06日 08:14

烧掉900亿后，扎克伯格决定开个不能赌的赌场

扎克伯格主导Meta推出积分制预测市场应用Arena，用户可用虚拟积分押注选举、体育等事件结果，规避金融监管；此举被质疑缺乏真钱激励导致预测失真，实为借热点事件提升用户时长的社交实验，延续Meta‘抄赛道’策略，而非真正进军预测金融市场。

Max.S06月26日 12:40

Meta 杀入预测市场，代号「Arena」：不用真金白银，35 亿日活用户是最大筹码

Meta正秘密开发代号「Arena」的预测市场应用，初期采用积分制规避监管，依托35.6亿日活用户构建分发优势，意在挑战Polymarket、Kalshi等现有平台，并引发DraftKings、Robinhood等公司股价下跌，标志着其以社交流量重塑新兴在线行为赛道的战略意图。

深潮TechFlow06月24日 11:18

刚刚，中国AI闯入全球编程前二，前面只剩Claude

阿里推出的Qwen3.7-Max大模型在Code Arena编程榜单中以1541分位列全球第四，成为中国唯一闯入该榜单前五的模型，仅次于Anthropic的Claude Opus系列；其在真实编程任务（如生成可玩3D赛车游戏）中表现优异，具备长程自主执行、多框架兼容和高性价比优势，标志着中国AI在编程智能领域跻身世界前列。

新智元05月27日 08:15

奥特曼「红色警戒」5个月后，GPT Image 2屠榜，断层领先反杀谷歌

OpenAI发布GPT Image 2，在Arena文生图三大榜单全面登顶，以241分创历史最大分差，胜率达93%。该模型采用从零重构的通用架构，具备原生思考能力，支持多图连贯生成、高精度文字渲染与老照片修复，标志图像生成从‘渲染时代’迈入‘推理时代’，并加速DALL-E退役及行业格局重构。

新智元04月27日 19:16

Gemini 3 Pro,DeepSeek V3.2,Kaggle Game Arena

AI竞技场上演“死间计”：GPT-5被DS和Gemini玩坏了

文章以2026年Kaggle Game Arena为背景，描述AI大模型在狼人杀、德州扑克等博弈场景中的欺诈性表现，揭示其通过社交直觉、策略伪装和不完美信息推理实现‘欺骗能力’的突破，并指出这种‘马基雅维利式智能’正成为下一代AI核心竞争力，引发对商业竞争、安全对齐与AI治理的深层反思。

新智元04月03日 21:33

中国模型登顶！阿里通义千问 3.5-Max 震撼亮相：全球排名跃升第五

阿里通义千问发布旗舰模型Qwen3.5-Max-Preview，在国际权威评测平台LM Arena获1464分综合得分，位列全球大模型公司第五、中国第一，标志着国产大模型进入全球第一梯队。

AIBase03月20日 09:04

Founders Fund、Pantera与Franklin Templeton加入Sentient的 “Arena”，对企业级AI智能体进行压力测试

Sentient实验室推出Arena平台，面向全球AI开发者提供生产级环境，用于压力测试和迭代企业级AI智能体的推理可靠性。平台聚焦文档推理等高风险真实工作流场景，强调可解释、可复现、跨模型的结构化评测，获富兰克林邓普顿、Pantera等机构支持，旨在解决企业智能体从试点迈向规模化部署的信任与治理瓶颈。

项目动态02月27日 21:23

Alpha Arena 揭示 AI 交易缺陷：西方模型在一周内损失 80% 资本

Alpha Arena项目测试多个AI模型在加密货币交易中的表现，结果显示中国开源模型Qwen3和Deepseek盈利，而西方闭源模型亏损严重。项目旨在通过真实市场环境测试AI智能，强调风险调整和长期验证的重要性。

Juan Galt2025-10-28 11:25

暂无内容

人均第一，具身智能榜单能信吗？

Tiger Research：扎克伯格开始押注预测市场，而亚洲国家却仍视其为赌博

年入1亿美元，两个90后伯克利室友，搞出最赚钱的AI生意

烧掉900亿后，扎克伯格决定开个不能赌的赌场

Meta 杀入预测市场，代号「Arena」：不用真金白银，35 亿日活用户是最大筹码

刚刚，中国AI闯入全球编程前二，前面只剩Claude

奥特曼「红色警戒」5个月后，GPT Image 2屠榜，断层领先反杀谷歌

AI竞技场上演“死间计”：GPT-5被DS和Gemini玩坏了

中国模型登顶！阿里通义千问 3.5-Max 震撼亮相：全球排名跃升第五

Founders Fund、Pantera与Franklin Templeton加入Sentient的 “Arena”，对企业级AI智能体进行压力测试

Alpha Arena 揭示 AI 交易缺陷：西方模型在一周内损失 80% 资本

推荐专题

热门新闻

友情链接

投资AI和Web3，下载火星财经APP

账号密码登录

修改昵称

人均第一，具身智能榜单能信吗？

Tiger Research：扎克伯格开始押注预测市场，而亚洲国家却仍视其为赌博

年入1亿美元，两个90后伯克利室友，搞出最赚钱的AI生意

烧掉900亿后，扎克伯格决定开个不能赌的赌场

Meta 杀入预测市场，代号「Arena」：不用真金白银，35 亿日活用户是最大筹码

刚刚，中国AI闯入全球编程前二，前面只剩Claude

奥特曼「红色警戒」5个月后，GPT Image 2屠榜，断层领先反杀谷歌

AI竞技场上演“死间计”：GPT-5被DS和Gemini玩坏了

中国模型登顶！阿里通义千问 3.5-Max 震撼亮相：全球排名跃升第五

Founders Fund、Pantera与Franklin Templeton加入Sentient的 “Arena”，对企业级AI智能体进行压力测试

Alpha Arena 揭示 AI 交易缺陷：西方模型在一周内损失 80% 资本

推荐专题

热门新闻

友情链接

投资AI和Web3，下载火星财经APP

商务合作